我们提出了一个利用归一化流的拓扑非平凡流形的学习概率分布的框架。当前的方法集中在对欧几里得空间同质形态的流形上,在学习模型上执行强大的结构先验或不容易扩展到高维度的操作。相比之下,我们的方法通过将多个局部模型“粘合”一起学习数据歧管上的分布,从而定义了数据歧管的开放覆盖。我们证明了我们的方法在已知流形的合成数据以及未知拓扑的较高维歧管上的效率,在许多任务中,我们的方法在许多任务中表现出更好的样品效率和竞争性或优越的性能。
translated by 谷歌翻译
Pre-trained protein language models have demonstrated significant applicability in different protein engineering task. A general usage of these pre-trained transformer models latent representation is to use a mean pool across residue positions to reduce the feature dimensions to further downstream tasks such as predicting bio-physics properties or other functional behaviours. In this paper we provide a two-fold contribution to machine learning (ML) driven drug design. Firstly, we demonstrate the power of sparsity by promoting penalization of pre-trained transformer models to secure more robust and accurate melting temperature (Tm) prediction of single-chain variable fragments with a mean absolute error of 0.23C. Secondly, we demonstrate the power of framing our prediction problem in a probabilistic framework. Specifically, we advocate for the need of adopting probabilistic frameworks especially in the context of ML driven drug design.
translated by 谷歌翻译
在带有电动车队的乘车系统中,充电是一个复杂的决策过程。大多数电动汽车(EV)出租车服务要求驾驶员做出利己主义决定,从而导致分散的临时充电策略。车辆之间通常缺乏或不共享移动性系统的当前状态,因此无法做出最佳的决定。大多数现有方法都不将时间,位置和持续时间结合到全面的控制算法中,也不适合实时操作。因此,我们提出了一种实时预测性充电方法,用于使用一个名为“闲置时间开发(ITX)”的单个操作员进行乘车服务,该方法预测了车辆闲置并利用这些时期来收获能量的时期。它依靠图形卷积网络和线性分配算法来设计最佳的车辆和充电站配对,以最大程度地提高利用的空闲时间。我们通过对纽约市现实世界数据集的广泛模拟研究评估了我们的方法。结果表明,就货币奖励功能而言,ITX的表现优于所有基线方法至少提高5%(相当于6,000个车辆操作的$ 70,000),该奖励奖励功能的建模旨在复制现实世界中乘车系统的盈利能力。此外,与基线方法相比,ITX可以将延迟至少减少4.68%,并且通常通过促进顾客在整个车队中更好地传播乘客的舒适度。我们的结果还表明,ITX使车辆能够在白天收获能量,稳定电池水平,并增加需求意外激增的弹性。最后,与表现最佳的基线策略相比,峰值负载减少了17.39%,这使网格操作员受益,并为更可持续的电网使用铺平了道路。
translated by 谷歌翻译
全球抗菌耐药性(AMR)的增加是对人类健康的严重威胁。为了避免AMR的传播,快速可靠的诊断工具可以促进最佳的抗生素管理。在这方面,拉曼光谱学有望在一步中快速标记和无培养物鉴定以及抗菌敏感性测试(AST)。但是,尽管许多基于拉曼的细菌识别和AST研究表现出了令人印象深刻的结果,但仍必须解决一些缺点。为了弥合概念验证研究和临床应用之间的差距,我们与新的数据增强算法相结合开发了机器学习技术,以快速鉴定最小制备的细菌表型和甲氧西林抗甲氧西林(MR)的区别(MR)的区别甲氧西林敏感(MS)细菌。为此,我们为细菌的超光谱拉曼图像实施了光谱变压器模型。我们表明,我们的模型在精度和训练时间方面都超过了许多分类问题的标准卷积神经网络模型。对于六种MR-MS细菌物种,我们在数据集中达到了超过96美元的分类精度,该数据集由15个不同类别和95.6 $ \%$分类精度。更重要的是,我们的结果仅使用快速,易于生产的培训和测试数据获得
translated by 谷歌翻译
本文致力于检测地球图像森林和非林区的问题。我们提出了两个统计方法来解决这个问题:一个基于多假设检测与参数分布家庭,另一个在非参数测试。参数化方法是文献中的新颖,与更大类别的问题相关 - 检测天然对象,以及异常检测。我们为两种方法中的每一种开发数学背景,使用它们构建自充足检测算法,并讨论其实现的数值方面。我们还将我们的算法与使用卫星数据的标准机器学习的算法进行比较。
translated by 谷歌翻译
有效的早期检测马铃薯晚枯萎病(PLB)是马铃薯栽培的必要方面。然而,由于缺乏在冠层水平上缺乏视觉线索,在具有传统成像方法的领域的早期阶段来检测晚期枯萎是一项挑战。高光谱成像可以,捕获来自宽范围波长的光谱信号也在视觉波长之外。在这种情况下,通过将2D卷积神经网络(2D-CNN)和3D-CNN与深度合作的网络(PLB-2D-3D-A)组合来提出高光谱图像的深度学习分类架构。首先,2D-CNN和3D-CNN用于提取丰富的光谱空间特征,然后使用注意力块和SE-RESET用于强调特征图中的突出特征,并提高模型的泛化能力。数据集采用15,360张图像(64x64x204)构建,从在实验领域捕获的240个原始图像裁剪,具有超过20种马铃薯基因型。 2000年图像的测试数据集中的精度在全带中达到0.739,特定带中的0.790(492nm,519nm,560nm,592nm,717nm和765nm)。本研究表明,具有深入学习和近端高光谱成像的早期检测PLB的令人鼓舞的结果。
translated by 谷歌翻译
口语关键字发现(KWS)处理音频流中的关键字的识别,并且由于几年前深度学习引入的范式转换,这已经成为一种快速增长的技术。这使得在无数的小型电子设备中迅速嵌入深度KW,与语音助手的激活一样不同的目的。前景表明这项技术的社会利用方面持续增长。因此,深刻的KW已经成为言语科学家之间的热门研究课题并不令人惊讶,他们不断寻找KWS性能提高和计算复杂性降低。这篇论文激励了本文,我们将文献综述融为深口语KW,以协助对这项技术感兴趣的从业者和研究人员。具体而言,这一概述通过覆盖对深kWs系统的彻底分析(包括语音特征,声学建模和后处理),鲁棒性方法,应用,数据集,评估指标,深kWs系统和视听kws的性能进行全面分析。本文执行的分析允许我们识别未来研究的许多方向,包括从自动语音识别研究和方向上采用的方向,这些研究和对口语问题的问题是独一无二的。
translated by 谷歌翻译
通过捕获来自宽频率范围的光谱数据以及空间信息,高光谱成像(HSI)可以检测温度,水分和化学成分方面的微小差异。因此,HSI已成功应用于各种应用,包括遥感安全和防御,植被和作物监测,食品/饮料和药品质量控制的精密农业。然而,对于碳纤维增强聚合物(CFRP)中的病症监测和损伤检测,HSI的使用是一个相对未受破坏的区域,因为现有的非破坏性测试(NDT)技术主要集中在提供有关结构的物理完整性但不对的信息材料组成。为此,HSI可以提供一种独特的方法来解决这一挑战。在本文中,通过使用近红外HSI相机,介绍了HSI对CFRP产品的非破坏性检查的应用,以EU H2020 FibreeUSE项目为背景。详细介绍了三种案例研究的技术挑战和解决方案,包括粘合剂残留检测,表面损伤检测和基于COBOT的自动检查。实验结果充分展示了HSI的巨大潜力和CFRP的NDT的相关视觉技术,特别是满足工业制造环境的潜力。
translated by 谷歌翻译